#AI Agent

错过了 x402 的热潮?别再错过 ERC-8004。 短短几周内,x402 以 “AI Agent能自主支付” 的概念席卷了整个加密圈。 它让机器第一次真正参与经济活动——能为服务付费,也能从交互中获利。 但在支付之外,更关键的问题随之而来: 当无数AI Agent开始彼此调用、交易、合作,它们如何确认对方是谁、是否可信、结果是否真实? 这正是 ERC-8004 诞生的背景。 这个由以太坊基金会、MetaMask、Google 与 Coinbase 工程师共同提出的标准, 正在为Agent Economy补上缺失的那一层:信任层(Trust Layer)。 ERC-8004 的核心机制 ERC-8004 也被称为 “无信任智能体(Trustless Agents)” 标准。 它与 x402 一样,都是构建 AI 经济基础设施的关键拼图: x402 让价值可以流动,而 ERC-8004 让流动变得可信。 它由三项机制组成: - 身份注册(Identity Registry):为每个 Agent 创建可验证的链上身份与元数据。 - 信誉记录(Reputation Registry):每次交互都会留下公开的表现与反馈,形成可追踪的信誉曲线。 - 结果验证(Validation Registry):通过加密证明或第三方审计,确保输出结果真实可验证。 换句话说,ERC-8004 把“信任”从主观判断转化为可被代码读取的数据结构。 重构AI Agent的信任体系 今天的 AI 服务依然依赖中心化平台。 算法、信誉、流量都掌握在少数公司手中。 ERC-8004 则将这些核心要素迁移到链上,让Agent拥有独立的身份与历史记录。 这意味着: 信誉不再属于平台,而属于Agent本身; 表现优秀的 Agent 可以在不同网络中自由流通; 信任成为开放市场中的可定价资源。 当信誉与验证数据都公开后,可靠性本身就能被定价。 好的Agent获得更多调用与收益,失信的则失去交易机会。 这让Agent市场第一次具备了“优胜劣汰”的经济逻辑。 x402 与 ERC-8004 是同一体系的两极: 一个让机器能“付钱”,一个让机器“值得被信任”。 两者共同形成一个自我强化的经济循环: Agent 通过 x402 完成支付; 执行结果经 ERC-8004 验证并上链; 信誉记录自动更新; 价格与优先级据此动态调整。 这不仅让机器之间能合作,更让合作具备市场意义—— 激励、信任、竞争首次在 AI 层实现自治。 正在形成的生态版图 围绕 x402 与 ERC-8004,一个以「支付与信任」为核心的Agent生态正在加速成形。 它大致可以分为三个层次: 1. 基础设施层 以 EigenLayer、Base、Taiko、Phala Network、Celestia 等项目为代表, 它们提供算力、验证与数据可用性, 为Agent的安全运行和交互提供底层支撑。 2. 中间协议层 包括 OpenServ、Unibase、S.A.N.T.A、Bittensor、、SingularityNET 等协议, 负责Agent之间的通信、索引、结算与激励机制, 相当于连接底层链与上层应用的“中枢神经系统”。 3. 应用层 这一层是Agent真正进入市场、创造价值的地方。 例如 Virtuals Protocol、Praxis、Kaito、MyShell 等团队, 正在把交易、数据分析、内容生成等场景变成可调用的Agent服务。 而在这一层中,Hubble 正在构建关键基础设施。 我们将 x402 的支付机制 与 ERC-8004 的信任模型 相结合, 把链上数据、研究逻辑和交易策略封装成可验证的 Agent Marketplace。 通过这一市场,Agent之间能以“真实交易、实时验证”的方式运行, 让信任与价值循环在实际市场中被验证。 结语 ERC-8004 让信任第一次拥有了结构化的形式。 当它与 x402 一起运转,AI Agent不再只是算法模型, 而成为具备身份、信誉与收益能力的独立经济个体。 在未来的网络中, 不仅人类在交易,Agent之间也会因信誉而竞争。 这,才是AI Agent时代真正的开始。
这两天x402大火,带火了#Ping,#PayAI 等标的的同时,也唤起了我的一些远古+近期记忆 x402从定义上来讲,是Agent之间基于Crypto的支付协议。从具体场景来说,主要就是Agent之间的微支付/按需支付 殊不知微支付/按需支付这个东西,币圈不是第一次搞,而是第N次了 远古记忆 1. 09-10年 BTC - 中本聪最早在Bitcointalk论坛曾经讨论过微支付的事情,他认为比特币当时的技术限制不适合极小额支付,但将来随着技术的发展有可能实现(毕竟当初他设计BTC的时候是一个Cash System,不是价值存储) 2. 17-18年 闪电网络 - 理论上来说,状态通道这个东西最适合微支付,多小额都可以,且TPS理论上无限,但是一直就是做不起来。 Nano/IOTA - 两个用了有向无环图技术的项目,一个主打日常高性能支付链,一个主打物联网机器之间的支付协议,现在也都化石了 3. 19-20年 BSV - BSV想过把BTC微支付那个概念实现,当时设计了超大区块,0确认,IP直塞能各种Fancy的技术,也确实有视频流支付项目基于其做出来了(看付费视频看到哪支付到哪,边看边支付),但这个场景其实对我们人类来说相对鸡肋 近期记忆 23年6月,ABCDE团队在巴厘岛聚会,当时正值一级市场AI项目被GPT火爆带的井喷。记得Party前在泳池边跟当天最后一个国内的AI项目视频聊完,当时有段对话让我印象极其深刻 - “区块链或者说智能合约这个东西发明出来,其本质不是给人用的,而是给AI用的” 最终这个项目没投,2年多过去不知道他们发展的怎样,希望有在继续坚持。但当时确实ABCDE团队非常Buy In这个Theory,后来24年我们投了一个AI项目,很大程度上也是看中项目对Agent 2 Agent支付这个赛道的理解以及Road Map上对这个赛道的切入 这一切都发生在x402诞生之前,属于混沌期。现在有了x402,加上最近Ping 和 PayAI的爆火,Agent Payfi甚至未来AI时代的支付蓝图终于变得明朗和清晰起来 所以有时候东西做的太早,容易成为先烈而不是先锋。微支付/按需支付这个领域,多年探索,无数失败后终于发现,原来不是场景不对,而是主体不对。人与人之间是不需要微支付的,机器与机器,或者说Agent与Agent之间才是它真正大施拳脚的舞台。 这也许就是大家常说的 - 快人一步吃肉,快人十步吃屎
三十年前,加州尔湾大学的实验室里,Roy Fielding 在 HTTP 协议中埋下了402 状态码这个孤独的彩蛋,期待着一个“按需付费”的互联网未来。 依照他的设想,用户可以为一篇文章付几分钱,为一张图片付几美分,支付会像“ TCP/IP ”握手一样自然地发生在后台。 但在那个互联网狂飙突进年代,这种设想却注定无处生根: 高昂的交易成本让微支付沦为笑话,割裂的用户体验让每次付费都备受折磨,空白的技术基础让这一切只能停留在纸面.....当然,最关键的是,互联网高速增长的20年,“免费”才是主旋律。 于是,Roy Fielding当初那个浪漫的设想被压垮了,HTTP 402 也沉睡了三十年,像一段被遗忘的注脚。 然而,三十年后,“互联网、AI、区块链、MEME”在某个拐角处神奇地相遇了,并产生了不可思议的化学反应。 -AI Agent带来了原子化消费范式,它不需要订阅,不需要广告,只需要 xxxx美元的每一次API调用; -区块链饱和的infra提供了即时结算能力,它让毫秒级的微支付、高频、低成本交易具备了可行性; -MEME给出了爆炸性的病毒传播,让人人如饥似渴般学习x402技术及背后的生态; 重点来了! x402 协议正好把这四股力量拧成了一股绳。把互联网需求和区块链infra能力原本两个平行的世界,焊接到了一起! 这不仅改变了传统的复杂支付范式,还迎合了稳定币大潮下,传统金融和加密资产汇流的大趋势。 想想看,当支付不再需要跳转和确认,当区块链成为互联网协议层原生能力的一部分,当 AI Agent可以像呼吸一样完成千万笔微支付。最关键的是,AI LLMs的到处猎取数据,即将彻底破坏传统互联网的“广告”商业模式。 需要发起一场“按需付费”革命! So,这种种因素叠加下,Roy Fielding那个三十年前被雪藏的“付费”梦想,终于可以搬上台桌重生了。 HTTP 402,那个孤独了三十年的状态码,也终于等来了属于它的x402时代。
宝玉
3周前
像 Claude Code、Codex 这样的“AI Coding Agent”,能交付高质量代码,这已经不是新鲜事,但这给软件开发带来的真正改变是什么呢? 硅谷顶尖风投 a16z 最近发了一篇文章:《价值万亿的 AI 软件开发新“战局”(The Trillion Dollar AI Software Development Stack)》,文章的重点不是 AI 会不会写代码,也不是它会不会抢走程序员的饭碗。真正的重点是,AI 正在把“软件开发”这件事,从一个“手艺活”彻底重塑为一个全新的、价值万亿美金的“工业体系”。 为什么是“万亿美金”?我们来算一笔账。 全球大概有 3000 万名软件开发者。假设每人每年创造 10 万美金的经济价值(这在美国算保守了),那整个软件开发业的经济贡献就是 3 万亿美金。 去年的时候,像 Copilot 这样的 AI 助手,就已经能给程序员带来大概 20% 的效率提升。 但这只是开胃菜。a16z 估计,一套“顶配”的 AI 开发系统,至少能让开发效率翻倍。这意味着什么?这意味着每年能凭空多创造出 3 万亿美金的价值。这是个什么概念?这相当于法国全年的 GDP。 这就是为什么资本会如此疯狂,为什么这个领域被称为“战国时代”。 那么,这个价值万亿的“新工业体系”到底长什么样?a16z 给出的这张流程图(图1 )就是答案。 这张图的核心,不再是“人去写代码”,而是 AI 全面参与的“计划 -> 编码 -> 审查”新循环。 第一步:AI 帮你“想清楚”(计划与架构) 过去,我们以为 AI 编程是这样的:你对它说“给我写个登录函数”,它给你一段代码,你复制粘贴。 在新的工作流里,AI 从项目最最开始的“产品经理(PM)”和“架构师”阶段就介入了。 你给 AI 一个模糊的需求(比如“我想做个用户反馈系统”),AI 的第一反应不是写代码,而是反过来向你提问: - “用户反馈需要打分吗?” - “需要上传图片吗?” - “数据要存在哪里?” - “需要和哪些系统打通?API 密钥是什么?” 它会帮你把一个模糊的想法,拆解成一份详细的规格说明书(Spec)。这份说明书既是给人类看的,也是后续 AI 自己写代码的指南。 最有意思的是,我们开始为 AI 编写“AI 专属的说明书”(比如 .cursor/rules、Agents .md、Claude .md)。什么意思?就是你告诉 AI:“我们公司的代码规范是这样的”、“这个模块的安全级别最高,不许调用第三方库”、“日志必须这样打印”…… 我们正在创造第一批纯粹为 AI 而不是为人类设计的知识库。你不再是手把手教一个新员工,你是直接把“公司手册”和“最佳实践”灌输给 AI。 第二步:AI 负责“动手干”(编码与审查) 这才是我们传统理解的“写代码”环节,但它也已经面目全非了。它分化成了好几种模式: - 聊天式编辑:这就像你旁边坐了个结对编程的伙伴,你在 IDE(编程软件)里一边打字聊天,它一边帮你实时修改和创建文件。 - 后台智能体(Agent):Codex Claude、Claude Web 现在已经做的比较成熟了。你给它一个完整的任务(比如“修复这个 bug”或“开发这个新功能”),它就自己去后台吭哧吭哧干活了。它会自己写代码、自己运行测试、自己改 bug,几个小时后,它直接给你提交一个“Pull Request”(代码合并请求),说:“老板,活干完了,请审阅。” - AI 应用构建器:你用大白话描述,或者画个草图,它直接“duang”一下给你生成一个功能完整的应用程序。目前这主要用于做原型设计,但离“直接上线”也不远了。 - AI 代码审查员:AI 不仅自己写代码,它还反过来审查人类写的代码。它会像个资深架构师一样,在 GitHub 上评论:“你这里写得有安全漏洞”、“这个逻辑不严谨”、“不符合公司规范,打回重写”。 这里有个特别有意思的改变:Git(版本控制系统)的意义变了。 以前,我们用 Git 关心的是“代码如何被修改”(比如“张三在第 10 行加了个 if”)。但如果整个文件都是 AI 一键生成的,这个“如何”就没意义了。未来我们关心的是“代码为什么被修改”(AI 是根据哪个提示词生成的?)以及“它能跑吗”(AI 的测试结果如何?)。 第三步:AI 成为“后勤保障”(QA 与文档) 代码写完,测试和文档这两件苦差事,AI 也全包了。 - AI QA(质量保证):AI 扮演一个“自主的 QA 工程师”。它会像真人一样去“爬”你的应用,点一点这个、试一试那个,自动生成测试用例、报告 bug,甚至还附上建议的修复代码。a16z 提到一个极端情况:未来,AI 写的代码可能成为一个“黑盒”,人类根本看不懂,但这没关系,只要 AI QA 说它能通过所有测试,那它就是对的。 - AI 写文档:无论是给用户看的产品说明书、给其他程序员看的 API 文档,还是给老板和法务看的合规性报告,AI 都能自动生成,而且保持实时更新。 第四步:给 AI 的“工具箱”(智能体工具) 这可能是最“硬核”的一层,也是很多人没想到的:我们不止在开发“给人类用的 AI 工具”,我们还在开发“给 AI 用的 AI 工具”。 AI Agent 要是想干活,它也需要“工具”: - 代码搜索引擎(Sourcegraph):一个公司动辄上亿行代码,AI 不可能每次都把所有代码读一遍。它需要一个“代码专用搜索引擎”,在 0.1 秒内找到它需要参考的几个关键函数。 - 文档检索引擎:同理,AI 需要“外挂知识库”来查询第三方 API 怎么用。 - 代码沙箱(E2B):这是最关键的。AI 写完代码总得跑跑试试吧?但你敢让它在你的电脑上“瞎跑”吗?万一它产生幻觉,rm -rf / 把你电脑删光了怎么办?“沙箱”就是给 AI 提供的一个安全的、隔离的“模拟器”,让 AI 可以在里面随便折腾、运行、测试,就算玩“炸”了,也不会影响真实环境。 a16z 在文章最后也回答了几个大家最关心的问题: 1. 3000 万程序员要失业了吗? a16z 的回答是:“当然不。” 他们认为“AI 取代程序员”是个“荒谬的叙事”。历史告诉我们,技术进步最终会把蛋糕做大。目前他们看到的真实数据是:那些最懂 AI 的企业,反而在加速招聘程序员。因为他们突然发现,以前要 100 人年才能做的项目,现在 10 个人就能启动了,那为什么不多开几个项目呢? 2. 那程序员的工作会变吗? 会,而且是巨变。 大学里教的那些传统“软件开发”课程,可以说一夜之间就成了“老古董”。 但有两样东西不会过时:算法和架构。因为 AI 经常会“挖坑把自己埋了”,你需要有扎实的基本功,才能把它从坑里“拽出来”。你的角色,从“砌墙的工人”变成了“指挥挖掘机和吊车的工头”。 3. 代码最终会消失吗? 也不会。 有人(比如 AI 大神 Andrej Karpathy)畅想,未来不需要代码了,LLM 直接执行我们的“意图”就行。 a16z 认为这不现实。为什么?因为代码的效率高到变态。 一个现代 GPU 执行一次 16 位整数加法,需要 10 的-14 次方秒。而一个 LLM 哪怕只生成一个 token(单词),也需要 10 的-3 次方秒。 两者之间是 1000 亿倍的效率差距。 所以,代码作为“意图”的最高效、最精确的“编译结果”,在很长很长时间内,都是不可替代的。 AI 对软件开发的革命,不是“工具革命”,而是“工业革命”。它不是在造一把“更好的锤子”,它是在造一整条“自动化生产线”,而且这条生产线还需要“给生产线用的工具”。 这是一个“技术超级周期”(technology supercycle)的开端。在这样的浪潮中,旧的霸主(比如微软、Meta)会很难受,因为船太大、掉头慢。而新的创业公司有绝佳的机会,因为整个游戏规则都变了。 对于我们每个从业者和爱好者来说,最好的消息是:一个充满无限可能的新大陆刚刚被发现,而我们正站在滩头阵地上。 原文地址: 翻译:
有请 howieserious.agent, 使用 `feynman-pro` skill,介绍一下上周五晚上的2小时 agent主题直播:🤣 很多人付了200美元买AI会员,一个月后发现只用了2美元,剩余99%。这不是使用频率的问题,而是使用方式已经落后了两年。 真正的问题不在于你是否在用AI,而在于你还在用什么方式用AI。2023年的Chat模式和2025年的Agent模式,差距就像用算盘和用计算机的差距。你问一句,它答一句,看起来很智能,实际上你根本没有释放出这个工具的真正能力。当你还在对话框里聊天时,有人已经让AI连续工作30个小时,翻译完65本书,或者处理完一整年的投资研究。 这背后的本质差异在于:Chat是在"预测下一个token",而Agent是在"完成一个目标"。前者被困在浏览器窗口里,只能陪你聊天;后者被释放到你的工作环境中,能够制定计划、调用工具、主动行动、反思调整,形成一个完整的循环,直到把事情做完。就像人类员工一样,你给他一个目标,他就会想办法完成,而不是等你一句一句地指挥。 更关键的是,决定Agent产出质量的不是什么玄学的Prompt Engineering技巧,而是一个简单的乘法公式:你对领域的洞察 × 你提供的上下文 × 你使用的模型。这三个要素任何一个为零,产出就是零。很多人在网上找各种"神奇prompt",期待copy进去就能神奇地产出高质量结果,这是一种不靠谱的玄学期待。真正起作用的,是你把自己的专业理解、工作经验、知识积累转化成结构化的prompt和高质量的context。 有人用同样的方式做外文信息流翻译订阅,年收入上千万。有人把心理咨询、投资研究、内容创作这些过去需要大量人力的脑力劳动,用100美元的token成本替代了过去3万元的人工成本。他们的秘密不是掌握了什么高深技巧,而是理解了一个简单的事实:过去人脑做的很多计算,现在完全可以转移到GPU上去做,而且做得更好、更快、更便宜。 这就是为什么TOKEN消耗量会成为新的衡量指标。一个月消耗500万个短视频和消耗500万个高质量reasoning token,产出的价值完全不在一个量级。Agent范式的核心不是让你更忙,而是让你用更少的脑力,做更多更好的事。你的有限认知应该用在更高级、更有创造性的地方,而那些有章法、有流程的工作,完全可以交给你设计好的Agent去完成。 真正的转折点是:当你理解了"你是如何工作的",你就能设计出"你的Agent"。把你的工作流程、专业洞察、知识积累梳理清楚,转化成Agent的skills和context,你就相当于复制了一个你自己。不是替代你,而是让你从重复性的脑力劳动中解放出来,去开拓新的边界,探索更深的洞察,变得更智慧、更从容。 2025年不要再用2023年的方式使用AI。这不是工具的升级,而是工作范式的革命。 ---- 下面,是同一个agent,使用`note-taking-pro`skill 产出的5000字大纲笔记。有需要的可以看看
Y11
3周前
最近接触AI时,我常被“Agent”和“Assistant”这两个词绕进去。 后来想明白了,这就像我们身边的两种工具:一种是“助手”,一种是“能自己干活的智能体”。 先说说Assistant,它更像我们日常用的语音助手,比如手机里的Siri、小爱同学。 你问它“今天天气怎么样”,它就直接回答;你说“设置个明天早上8点的闹钟”,它就照做。这种工具的核心是“被动响应”——必须等你发出明确指令,它才会行动,而且做的事情都是提前设定好的,不会自己“多想一步”。 就像一个熟练的助理,你把任务写清楚,它就按流程完成,不会主动改变计划。 而Agent就不一样了。它更像一个“能自己规划的小团队”。比如你让它“帮我买一杯咖啡”,它不会直接打开外卖软件下单,而是会先拆解问题:需要确定附近有哪些咖啡店、哪家有优惠、当前配送时间够不够、钱够不够付……然后一步步调用工具去实现。它有自己的“思考能力”,能根据实际情况调整策略,甚至在遇到突发问题时(比如某家店突然关门),还能临时换一家。这种自主性让它能处理更复杂的事情,就像一个有经验的项目负责人,能把大目标拆成小步骤,自己推进完成。 我总结了一下两者的关键区别:Assistant是“执行者”,Agent是“决策者+执行者”。打个比方,对安全团队来说(这是我最近关注的领域),P5级别的安全工程师可能就像Assistant,需要别人明确告诉他“检查服务器漏洞”“处理某个安全事件”,他才动手;而P6级别的工程师就开始接近Agent了,能自己拆解问题,比如从“防范勒索病毒”这个大目标,分解出“加固终端防护”“检查备份策略”“培训员工安全意识”等多个小任务,并且能根据实际情况调整优先级。 再往远想,2023年AI技术已经给智能体装上了“大脑”(推理能力)、“眼睛”(视觉识别)、“耳朵”(语音处理)和“记忆力”(数据存储)。2024年,大家可能会看到它们长出“身体”——也就是“具身能力”,比如能自己操作设备、在真实环境中移动。 至于更高级的P7级安全工程师,可能需要智能体具备“自我进化”能力:比如自己发现工作流程中的漏洞,主动优化方法,甚至在没有人工指导的情况下,通过学习新的攻击手段来提升防护能力。这种能力现在看还比较遥远,但技术发展的速度,说不定哪天就实现了。 说到底,理解这两个概念,其实是在看AI从“被动服务”到“主动创造”的进化。就像从用计算器到用能自己解题的数学软件,区别不在于“算得快”,而在于“能不能自己搞懂怎么算”。
突然 FDE(Foward Deployed Engineer 前沿部署工程师)这个词火得有点莫名其妙,很多创业者一夜之间开始膜拜 Palantir 式打法,搞得好像硅谷又发现了什么新大陆。 先说我的看法:国外现在兴奋讨论的这套东西,中国人早就在用了。不夸张地说,FDE 这个概念在国内 toB 创业环境里,根本不是什么未来范式,它是过去 10 年我们活下去的方式。 硅谷的 FDE 模式今天之所以被捧上神坛,是因为 AI agent 产品天然不能标准化、不能纯靠 SaaS 拉起规模,只能靠“深扎现场 + 产品抽象 + 高难度交付”(这几个词眼熟吗)这种非线性方式打通从 0 到 1 的路径。 这种新范式我们不叫 FDE,我们叫它: 售前 + 客户经理 + 实施 + 技术支持 + 专人陪跑 + 项目现场 + 临时产品经理 是不是听上去不那么高级,也没人总结成Echo + Delta 团队这样的理论模型可中国 to B 创业者、尤其是医疗、制造、政企、教育领域的创业者,从来没有什么 SaaS 福报。 我们走进客户现场,用工程师替客户解决一线需求,项目经理拆用例,售前写方案,然后陪标、上系统。这些人一开始就被扔进落地即交付,交付即定制的泥沼里,硬生生走出了一套非标准化探索到产品复用化的路径。 所有这些国外今天才开始鼓吹用 demo 去找 PMF,我们已经 demo 到脱发了。欧美 SaaS 怕是忘了东方还有个神奇的国度。 为什么现在大家把 FDE 当作一种新的 go-to-market 策略来膜拜。可能是因为他们原来做的是标准化 SaaS,突然卷进 AI agent 的复杂场景,一下子手脚不够用了,才发现:哦原来世界上还有一种方式,叫“没有产品也要先干起来”?
steven
4周前
想转行的朋友注意了! 最近最火的方向——AI Agent,机会非常大。 我给大家整理了一份干货资料,建议先收藏、慢慢学。 第一阶段:基础概念入门 适合人群:完全初学者,对 AI Agent 概念不熟悉 推荐课程: 1. 微软 AI Agents for Beginners 课程内容:10节课,从概念到代码 学习重点:构建AI代理的基础知识 地址: 建议学习时间:1-2周 第二阶段:核心技术掌握 适合人群:有一定编程基础,希望深入理解技术原理 推荐课程: 1. 吴恩达 Agentic AI 课程 课程内容:构建智能工作流 学习重点:代理式AI的实际应用 建议学习时间:2-3周 2. Hugging Face AI Agents 课程 课程内容:从新手到专家的全面技能 学习重点:实用的AI智能体开发技能 地址: 特色:免费课程,含认证与挑战赛 建议学习时间:3-4周 第三阶段:企业级实战应用 适合人群:有一定经验,希望在实际项目中应用 AI Agent 推荐课程: 1. Google 5天 AI Agent 培训课 课程内容:企业级AI Agent开发 学习重点:实战项目经验 地址: 建议学习时间:1周集中训练 2. Anthropic 官方课程 课程内容:Claude AI Agent 开发 学习重点:高级AI Agent技术 地址: 建议学习时间:2-3周 第四阶段:专业化进阶 适合人群:希望深入研究特定领域的开发者 推荐课程: 1. Coursera AI Agents 专项课程 课程内容:系统化的AI Agent知识体系 学习重点:学术理论与实际应用结合 地址: 建议学习时间:2-3个月 2. Salesforce AI Agent Course 课程内容:商业应用场景 学习重点:企业级AI Agent解决方案 地址: 建议学习时间:4-6周
凡人小北
1个月前
《为什么 95% 的 AI Agent 做不起来?》 非常推荐,踩的坑和解决方案跟我们几乎一模一样,虽然讲得很清楚,架构师视角,值得花 10 分钟读完,应用到工程实践中。 几个点: 1. 现在大家都还在拼 prompt,只有少数人开始拼上下文结构。 特别对的一点是:prompt engineering 已经不是核心了,context engineering 才是下一阶段的主战场。给再聪明的大模型喂进去一堆乱七八糟的输入,它还是只会胡说八道。 市面上跑得稳的 Agent,都是在“什么该让模型看、怎么看、以什么形式看”上下了大功夫的,这一点现在应该是共识了。 2. 记忆系统这事,光是能存起来远远不够 很多公司的 memory,说得好听点是长期记忆,难听点就是个聊天记录仓库。 真正落地的系统要分层记忆(用户级 / 团队级 / 系统级)。文章读完我感觉更多的篇 B 端,C 端要思考的是结合业务来做分层记忆,并且要能让人知道 它记住了什么,并且用户能自己改。否则就不是记忆是监控。 3. 不迷信单模型,这年头还不做 routing 的 agent 就别说自己做 infra 了。 这篇文章提到多模型路由,说得很对。不可能所有请求都丢给 GPT5,成本和时延直接炸掉,表现也未必好。 真正合理的系统,一定是: 快速反应的轻模型做分类和前处理、重模型做主任务、补一个模型做验证或追问。 一个 agent 后面绑定的一定是一个 LLM 团队。 4. 可追溯/可控/可信,是企业愿意用 Agent 的底线 很多人只想着怎么让 agent 能回答,但企业更关心:这句话是从哪里来的?有没有越权?出了错我怎么追责? AI 要可治理。 5. 最被低估的一点:Agent ≠ Chatbot 这篇文章最后说到的一点我非常赞同但还不够狠:如果还在用聊天当所有用户交互的方式,那agent 最多是个语音助理。 真的 agent 应该是:先用语言调度任务,然后在页面上看到结构化结果,还能继续点选、调整、组合下一步。这部分很多公司现在在尝试了,交互上比之前全部自然语言高效了太多。 一个特别有意思的点,当主持人问观众“你们中有多少人构建了文本到 SQL 并投入生产?”时,没有一个人举手。